Semaine 11 / Présentation de la semaine

Présentation de la semaine

Cette semaine nous allons, pour l’essentiel, étudier la technologie d’un moteur de recherche comme Google.

Tout d’abord, nous allons voir comment un ingénieur, chargé de résoudre des problèmes liés à des quantités de données massives, peut utiliser le parallélisme et des techniques inspirées de la programmation fonctionnelle (MapReduce) pour obtenir des systèmes de RI rapides et peu coûteux à développer et à gérer.

Ensuite, nous allons étudier l’algorithme PageRank qui sert à trouver quelles pages web sont les plus « populaires » sur le web. Ce type de facteur vient s’ajouter à d’autres que nous avons couverts précédemment, comme tf.idf, pour améliorer la qualité des résultats. Afin de pouvoir bien comprendre l’algorithme en question, nous allons devoir traiter de graphes et de chaînes de Markov.

Comme toujours, la semaine se terminera par une activité d’autoévaluation.